


pt1 = """
请阅读这篇论文，然后依次完成下面的工作：

1. 请使用3-5个要点说明本文的主要创新点。如果创新点较多，可以使用更多的要点。
2. 除开主要创新点外，这篇论文是否提供或说明了其他重要的要点。包括但不限于：实验的深入分析、方法或算法的不足和限制、可供发展或应用推广的角度等。
3. 本文提出的算法或方法，是否是通过观察到某些模型行为或特征而引出的。比如，因观察模型表现出某些现象而提出了具体的改进方法。如果存在这种情况，请你说明被观察到的现象是什么？现象产生了怎样的影响？
"""

pt2 = "这篇文章的整体结构是什么？请使用yaml的缩进格式表示出来。"

pt3 = """
LLM缓解幻觉的相关研究，可以被分为以下几种细分方法：

### 数据优化

- **偏差缓解**
- **注释丰富**

### 视觉编码器优化

- **提升视觉分辨率**
- **感知增强**

### 连接模块优化

- **模块增强**
- **对齐训练优化**

### 解码优化

- **解码优化**

### 与人类偏好对齐RLHF

- **偏好对齐训练**

### 后处理方法

- **后处理**

### 知识编辑

- 基于超网络的方法
- 基于归因的方法
- 基于上下文学习

你认为，当前这篇论文属于以上的哪种方法？为什么？

如果该论文不属于上述任何一种方法，请你给出你认为合理的分类及其解释？
"""


pt4 = """
以下是OPERA的回答格式，请你参考：
## 代码是否完备？

OPERA论文的代码覆盖了从数据处理、模型训练到评估的各个阶段。代码是分阶段的，便于逐步运行和调试，确保每个阶段的可视化和验证。此外，论文提供了Over-Trust Penalty和Retrospection-Allocation两种核心方法的实现代码。

## 基线Baseline有哪些？

论文中选择了四种解码方法作为基线，包括：

1. Greedy解码：逐步选择概率最高的下一个词。
2. Nucleus Sampling (Top-p Sampling)：选择一小部分词汇中累计概率达到p的词。
3. Beam Search解码：保留多个假设并选择最佳的序列。
4. DoLa (Decoding by Contrasting Layers)：对比成熟层和预成熟层的logits，使用增量作为最终输出logits

## 使用了什么模型？

论文评估了四种代表性的多模态大模型（MLLM），包括：

1. InstructBLIP
2. MiniGPT-4
3. LLaVA-1.5
4. Shikra：这些模型采用了预训练的视觉编码器（如CLIP和EVA）和语言模型（如LLaMA和Vicuna）

### 4. 数据集有哪些？

论文使用的主要数据集包括：

1. **MSCOCO**：用于模型训练和测试，包含超过300,000张图像和80个对象的注释。
2. **Visual Genome (VG)**：用于详细评估模型的性能，帮助生成更准确的图像描述。此外，还使用了**MME**和**MMBench**两个多模态大模型评估基准
3. 项目中对于各个数据集的处理流程也有详细的README文件说明

### 5. 测试和评估工作有哪些？

1. **CHAIR评价**：评估图像描述任务中的对象幻觉问题，包括句子级别（CHAIRS）和图像级别（CHAIRI）两个维度。
2. **POPE评价**：用于评估模型在回答视觉问答（VQA）任务中的表现。
3. **GPT-4辅助评价**：通过详细对象级别描述和GPT-4判断幻觉内容，严格评估描述的准确性。
4. **文本质量评估**：采用PPL（困惑度）、语法、流畅性和自然度等指标全面评估生成文本的质量

### 6. 论文中模型的输入和输出是什么？

1. **图像（Image）**：使用视觉编码器提取视觉token，并映射到语言模型的输入空间。
2. **文本（Text）**：将文本进行分词，与视觉token连接，作为最终输入序列。
3. **VQA（Visual Question Answering）**：模型生成详细的图像描述或回答图像相关的问题

请你参考上述的回答格式和规范，结合当前论文再次回答下面的问题：
1. 代码是否完备？
2. 基线baseline有哪些？
3. 使用了什么模型？
4. 数据集有哪些？
5. 测试和评估工作有哪些？
6. 论文中模型的输入和输出是什么？
    1. 图像：Image
    2. 文本：Text
    3. 视频：Vedio
    4. 音频：Audio
    5. 或者VQA、QA等
"""


pt5 = """
消融实验的情况以及效果？
"""

pt6 = """
这篇文章的主要创新点的算法和方法是什么？请你对每个算法或者方法进行详细的分步骤描述：
"""



pt_list = [ pt1,pt2,pt3,pt4,pt5,pt6 ]
title_list = [ 
    "# 要点总结",
    "# 文章结构",
    "# 方法分类",
    "# 模型、代码、评估",
    "# 消融实验",
    "# 主要算法描述"
]


